Cilj ovog rada je analiza i predikcija dnevnih karata Temperature (Tempreture) na podrucju teritorije R. Srbije, na osnovu merenja dostupnih sa 65 mernih stanica. Merne stanice pripadaju OGIMET mrezi stanica. Prostorni domen predikcije definisan je pravilnim gridom cija prostorna dispozicija odgovara prostornom rasporedu mernih stanica, dok temporalni domen merenja obuhvata period od 10 godina (2009-2018). Merenja su dostupna na dnevnom nivou izrazena kao srednje, maksimalne i minimalne vrednosti dnevnog prikupljanja podataka sa senzora. U radu je koriscen programski jezik R sa dostupnim biblioteka putem kojih su implementirane tehnike Prostorno vremenske predikcije (gstat, spacetime).
Metodologija podrazumeva jasno definisan niz postupaka u cilju izrade karata srednje, maksimalne i minimalne vrednosti temperatura sa prostornom rezolucijom od 1km. Metodologija obuhvata koriscenje sledecih pristupa u oceni i predikciji posmatrane promenljive:
Kao ocena kvaliteta predikcije izvrsen je postupak krosvalidacije (CV - Cross-validation):
Analizom dostupnog seta podataka na raspolaganju su sledeci podaci:
Za potrebe analize seta podataka i istrazivanja (sagledavanja lokacija mernih stanica, njihove udaljenosti i prostornog rasporeda, visina na kojima se nalaze), veoma je bitno u pocetnoj fazi rada sagledati prostornu dispoziciju seta podataka, kao i postaviti pocetne hipoteze u vezi njihovih lokacija. Na narednoj karti moguce je sagledati prostornu dispoziciju 65 mernih stanica.
Analizom seta podataka, kreiran je graficki prikaz vremenske serije podataka. Na gornjem delu grafickog prikaza data je vremenska linija vrednosti Temperature, po godinama, sa tim sto su po \(\mathbf{x}\) osi date vrednosti vremenskih trenutaka izrazenih po Julianskom kalendaru (godina 2455000 po Julianskom kalendaru odgovara 2009 godini po Gregorijanskom kalendaru), Na donjem delu grafika dat je boxplot graficki prikaz Temperature izrazene po godinama, za srednje, maksimalne i minimalne vrednosti opazanja.
Na sledecem grafickom prikazu dat je histogram frekvencija merenih vrednosti srednje, maksimalne i minimalne temperature, kao i kriva normalne rapodele koja odgovara datom uzorku. Uocava se da se podaci u potpunosti pokoravaju normalnoj raspodeli, sa srednjom vrednoscu i merama odstupanja vrednosti slucajne promenjive od njenog matematickog ocekivanja - standardnom devijacijom. Glavni preduslov za koriscenje tehnika predikcije - kriginga je da podaci, tj. uzorak merenja pripada normalnoj raspodeli, sto je i ispunjeno.
Hovmoller plot - graficki prikaz je dvodimenzionalni prostorno-vremenski nacin vizuelizacije. Prostorni domen je predstavljen na jednoj osi (projektovan ili osrednjen), dok je po drugoj osi definisano vreme. Ovakav nacin vizuelizacije se tradicionalno primenjuje u klimatologiji i meteorologiji, u naukama i oblastima koje se bave pracenjem stanja atmosfere, mora i okeana, kako bi se na veoma efikasan nacin predstavila - vizuelizovala propagacije entiteta. [Wikle et al., 2019] Pomocu ovakvog nacina vuzuelizacije moguce je sagledati korelacije u prostorno-vremenskom domenu, tj. npr. geografske sirine ili duzine i vremena, vremenskih trenutaka opazanja posmatrane promenljive. Na ovaj nacin moguce je ostvariti i preliminarni uvid u postajenje trenda koji se opisuje i koordinatama tacaka.
Za potrebe predikcije vrednosti Temperature nad podrucjem od interesa i u vremenskom domenu, koji je definisan kao dan, kreiran je grid - skup tacaka na pravilnom i jednakom rastojanju. Prostorna rezolucija grid-a je 1km, dok je vremenska rezolucija 1 dan, posmatrano za vremesnki interval 01.01.2009-31.12.2018. Ciljni grid je kreiran kao objekat STF klase podataka, paketa “spacetime” (Spatio-Temporal Feature).
U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Srednje vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu globalnog (STRK_global) modela [Kilibarda et al., 2014], gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa.
Ocenu kvaliteta modela i predikcije kontinualne promenljive je moguce oceniti unutrasnjim i spoljasnjim merama kvaliteta. Kao unutrasnje mere kvaliteta, koriste se koeficijent determinacije lineranog modela i varijansa kriging predikcije. Kod spoljasnjih mera ocena kvaliteta modela predikcije, moZe se koristiti nezavisan set podataka kojim se model ocenjuje tokom ili nakon izgradnje modela. Kada nije dostupan set podataka za validaciju modela, moguce je iskoristiti isti set podataka, ali iskljucivanjem pojedinih prostornih i/ili vremesnkih entiteta - merenja iz izgradnje modela. Takva metoda ocene kvaliteta i validacije modela predikcije naziva se \(\mathbf{krosvalidacija}\).
Krosvalidacijom se vrsi ocena modela predikcije na taj nacin sto se za izgradnju modela koristi potpun set podataka, a zatim prilikom predikcije u zadatom prostorno-vremenskom domenu jedan i/ili vise merenja na jednoj ili viSe lokacija uzoraka se ne koriste. Koriste se sledece metode krosvalidacije:
Date metode krosvalidacije nisu primenljive za modele koji ne podrazumevaju teoriju geostatistike, tj. teoriju prostorne korelacije. U ovom radu je koriscena prva metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.
Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:
| RMSE | units |
|---|---|
| 1.4916 | °C |
Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:
| R2 | units |
|---|---|
| 0.9714 | / |
Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima. Ocigledno je da postoji zakonitost u podacima, kojom se opisuje manji opseg vrednosti, kao i greska predikcije u letnjim mesecima. U zimskim mesecima postoji veca varijabilnost seta podataka, kao i da je greska predikcije veca.
| MESEC | RMSE [°C] | MAX [°C] | MIN [°C] | MEAN [°C] | RANGE [°C] |
|---|---|---|---|---|---|
| Jan | 1.70 | 18.9 | -17.2 | 1.40 | 36.1 |
| Feb | 1.59 | 23.0 | -19.8 | 3.33 | 42.8 |
| Mar | 1.39 | 22.1 | -13.4 | 7.73 | 35.5 |
| Apr | 1.28 | 27.6 | 0.0 | 13.19 | 27.6 |
| Maj | 1.31 | 27.9 | 2.2 | 17.17 | 25.7 |
| Jun | 1.39 | 33.4 | 9.2 | 21.05 | 24.2 |
| Jul | 1.46 | 35.4 | 11.7 | 23.39 | 23.7 |
| Avg | 1.49 | 35.0 | 10.6 | 23.37 | 24.4 |
| Sep | 1.43 | 31.5 | 5.9 | 18.61 | 25.6 |
| Okt | 1.42 | 26.8 | 0.1 | 12.49 | 26.7 |
| Nov | 1.57 | 22.9 | -7.6 | 8.05 | 30.5 |
| Dec | 1.78 | 19.7 | -15.0 | 2.75 | 34.7 |
Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije metodom krosvalidacije po stanicama, na kojima je opazana temperatura - TMEAN za dati vremenski period.
U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Srednje vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu lokalnog (STRK_local) modela, gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa. Koeficijenti trenda, kao i vrednosti reziduala su ocenjeni na osnovu MLR - multiple linear regression modela, a zatiom je kreiran i variogram na osnovu ocenjenih reziduala. Izvrsena je ocena i fitovanje empirijskog prostorno-vremenskog variograma (sum-metric variogram, putem R paketa ‘gstat’).
Model koji je kreiran MLR regresijom, gde su kao prediktori korisceni GTT, DEM i TWI.
##
## Call:
## lm(formula = tmean ~ gtt_mean + dem + twi, data = temp_df.lok)
##
## Coefficients:
## (Intercept) gtt_mean dem twi
## 14.053091 1.015398 -0.007973 -0.482840
Nakon kreiranja prostorno-vremenskog variograma, koji opisuje set podataka i zavisnost - korelaciju izmedju merenja na razlicitim lokacijama i razlicitim vremenskim trenucima, potrebno je izvrsiti fitovanje modela - odredjivanje matematicke funcije i njenih parametara koji na najbolji moguci nacin opisuju set podataka. Fitovanje variograma se postize odredjivanjem inicijalnih parametara funkcije na osnovu vizuelnog pregleda podataka. Konacna empirijska funkcija, kao i njeni parametri se odredjuju automatski kroz vise iteracija. R programski paket “gstat” nudi vise modela za fitovanje variograma prostorno-vremenskih podataka: separable, product sum, metric, sum metric, and simple sum metric. Vise informacija o svakom modelu ponaosob se moze pronaci u radu [Graler et al., 2015]. Za modelovanje prostorno-vremenskog variograma vrednosti merenja srednje vrednosti temperatrura TMEAN, koriscen je sum metric model, koji podrazumeva ukljucivanje prostorne i vremenske komponente putem modela kovarijansi - poluvariograma, kao i zajednicke komponente sa vrednovanjam parametra anizotropije. Prostorno vremenska funkcija kovarijanse data je na sledeci nacin:
\[ \begin{aligned} \mathbf{Csm (h, u) = Cs (h) + Ct (u) + Cjoint (sqrt(h^2 + (k*u)^2))} \end{aligned} \]
gde je:
U cilju odredjivanja inicijalnih vrednosti parametara variograma potrebno je zadati pocetne vrednosti parametra psill - parcijalni prag i range - domet. Vrednost parcijalnog praga je priblizno jednaka vrednosti varijanse seta podataka. Za pocetnu vrednost dometa moguce je uzeti 1/4 vrednosti dijagonale minimalnog obuhvatnog pravougaonika podrucja od interesa obuhvacenog stanicama, sa tim da se ta vrednost uzima samo za prostornu komponentu.
Srednja vrednost varijanse vrednosti TMEAN na osnovu vrednosti po stanicama
| Variance_s | units |
|---|---|
| 14.1867 | °C^2 |
Srednja vrednost varijanse vrednosti TMEAN na svim stanicama za posmatrani vremenski period [°C]
| Variance_t | units |
|---|---|
| 14.9846 | °C^2 |
Srednja vrednost varijanse vrednosti TMEAN u prostorno-vremenskom domenu [°C]
| Variance_j | units |
|---|---|
| 14.5857 | °C^2 |
Prikaz empirijskog prostorno-vremenskog variograma, fitovanog koriscenjem sum-metric modela. Model je dobijen koriscenjem funkcija vgmST() i fit.StVariogram(), R programskog paketa “gstat”. Priblizna vrednost koeficijenta anizotropije je sracunata empirijski koriscenjem funkcije estiStAni(). Za fitovanje modela variograma koriscena je sferna funkcija kod sve tri komponente: prostorne, vremenske i zajednicke - prostorno-vremenske.
Mean Squared Error (MSE) - srednja kvadratna greska optimizacije modela variograma po metodi najmanjih kvadrata
| Mean Squared Error | units |
|---|---|
| 0.2446 | °C |
| model | psill | range |
|---|---|---|
| Nug | 0.0000 | 0.0 |
| Sph | 1.9576 | 166975.5 |
| model | psill | range |
|---|---|---|
| Nug | 0.3604 | 0.0000 |
| Sph | 10.3668 | 9.8104 |
| model | psill | range |
|---|---|---|
| Nug | 0.0000 | 0.0 |
| Sph | 1.9366 | 415421.3 |
| anisotropy | units |
|---|---|
| 116.6199 | km/day |
U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Koriscen je identican model - prostorno-vrmenski variogram dobijen na osnovu potpunog skupa merenja. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.
Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:
| RMSE | units |
|---|---|
| 1.1053 | °C |
Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:
| R2 | units |
|---|---|
| 0.9843 | / |
Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima.
| MESEC | RMSE [°C] | MAX [°C] | MIN [°C] | MEAN [°C] | RANGE [°C] |
|---|---|---|---|---|---|
| Jan | 1.36 | 18.9 | -17.2 | 1.40 | 36.1 |
| Feb | 1.24 | 23.0 | -19.8 | 3.33 | 42.8 |
| Mar | 1.00 | 22.1 | -13.4 | 7.73 | 35.5 |
| Apr | 0.94 | 27.6 | 0.0 | 13.19 | 27.6 |
| Maj | 0.87 | 27.9 | 2.2 | 17.17 | 25.7 |
| Jun | 0.88 | 33.4 | 9.2 | 21.05 | 24.2 |
| Jul | 0.96 | 35.4 | 11.7 | 23.39 | 23.7 |
| Avg | 1.03 | 35.0 | 10.6 | 23.37 | 24.4 |
| Sep | 1.01 | 31.5 | 5.9 | 18.61 | 25.6 |
| Okt | 1.07 | 26.8 | 0.1 | 12.49 | 26.7 |
| Nov | 1.31 | 22.9 | -7.6 | 8.05 | 30.5 |
| Dec | 1.42 | 19.7 | -15.0 | 2.75 | 34.7 |
Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije po stanicama, na kojima je opazana temperatura - TMEAN za dati vremenski period.
U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Maksimalnih vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu globalnog (STRK_global) modela [Kilibarda et al., 2014], gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa.
U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.
Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:
| RMSE | units |
|---|---|
| 1.7764 | °C |
Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:
| R2 | units |
|---|---|
| 0.9696 | / |
Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima. Ocigledno je da postoji zakonitost u podacima, kojom se opisuje manji opseg vrednosti, kao i greska predikcije u letnjim mesecima. U zimskim mesecima postoji veca varijabilnost seta podataka, kao i da je greska predikcije veca.
| MESEC | RMSE [°C] | MAX [°C] | MIN [°C] | MEAN [°C] | RANGE [°C] |
|---|---|---|---|---|---|
| Jan | 2.09 | 21.8 | -11.9 | 5.35 | 33.7 |
| Feb | 1.95 | 29.4 | -12.9 | 7.72 | 42.3 |
| Mar | 1.68 | 27.6 | -7.8 | 13.22 | 35.4 |
| Apr | 1.58 | 34.0 | 1.4 | 19.45 | 32.6 |
| Maj | 1.55 | 36.4 | 4.5 | 23.34 | 31.9 |
| Jun | 1.59 | 42.3 | 11.6 | 27.28 | 30.7 |
| Jul | 1.62 | 42.8 | 13.8 | 30.13 | 29.0 |
| Avg | 1.64 | 43.9 | 14.6 | 30.66 | 29.3 |
| Sep | 1.60 | 40.2 | 9.9 | 25.43 | 30.3 |
| Okt | 1.65 | 35.0 | 1.2 | 18.58 | 33.8 |
| Nov | 1.91 | 30.0 | -3.7 | 13.23 | 33.7 |
| Dec | 2.28 | 27.0 | -9.3 | 6.75 | 36.3 |
Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije metodom krosvalidacije po stanicama, na kojima je opazana temperatura - tmax za dati vremenski period.
U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Maksimalne vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu lokalnog (STRK_local) modela, gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa. Koeficijenti trenda, kao i vrednosti reziduala su ocenjeni na osnovu MLR - multiple linear regression modela, a zatiom je kreiran i variogram na osnovu ocenjenih reziduala. Izvrsena je ocena i fitovanje empirijskog prostorno-vremenskog variograma (sum-metric variogram, putem R paketa ‘gstat’).
Model koji je kreiran MLR regresijom, gde su kao prediktori korisceni GTT, DEM i TWI.
##
## Call:
## lm(formula = tmax ~ gtt_max + dem + twi, data = temp_df.lok)
##
## Coefficients:
## (Intercept) gtt_max dem twi
## 7.091419 1.154409 -0.005855 -0.251901
Nakon kreiranja prostorno-vremenskog variograma, koji opisuje set podataka i zavisnost - korelaciju izmedju merenja na razlicitim lokacijama i razlicitim vremenskim trenucima, potrebno je izvrsiti fitovanje modela - odredjivanje matematicke funcije i njenih parametara koji na najbolji moguci nacin opisuju set podataka. Fitovanje variograma se postize odredjivanjem inicijalnih parametara funkcije na osnovu vizuelnog pregleda podataka. Konacna empirijska funkcija, kao i njeni parametri se odredjuju automatski kroz vise iteracija. R programski paket “gstat” nudi vise modela za fitovanje variograma prostorno-vremenskih podataka: separable, product sum, metric, sum metric, and simple sum metric. Vise informacija o svakom modelu ponaosob se moze pronaci u radu [Graler et al., 2015]. Za modelovanje prostorno-vremenskog variograma vrednosti merenja Maksimalne vrednosti temperatrura TMAX, koriscen je sum metric model, koji podrazumeva ukljucivanje prostorne i vremenske komponente putem modela kovarijansi - poluvariograma, kao i zajednicke komponente sa vrednovanjam parametra anizotropije. Prostorno vremenska funkcija kovarijanse data je na sledeci nacin:
\[ \begin{aligned} \mathbf{Csm (h, u) = Cs (h) + Ct (u) + Cjoint (sqrt(h^2 + (k*u)^2))} \end{aligned} \]
gde je:
U cilju odredjivanja inicijalnih vrednosti parametara variograma potrebno je zadati pocetne vrednosti parametra psill - parcijalni prag i range - domet. Vrednost parcijalnog praga je priblizno jednaka vrednosti varijanse seta podataka. Za pocetnu vrednost dometa moguce je uzeti 1/4 vrednosti dijagonale minimalnog obuhvatnog pravougaonika podrucja od interesa obuhvacenog stanicama, sa tim da se ta vrednost uzima samo za prostornu komponentu.
Srednja vrednost varijanse vrednosti TMAX na osnovu vrednosti po stanicama
| Variance_s | units |
|---|---|
| 23.8744 | °C^2 |
Srednja vrednost varijanse vrednosti TMAX na svim stanicama za posmatrani vremenski period [°C]
| Variance_t | units |
|---|---|
| 24.6037 | °C^2 |
Srednja vrednost varijanse vrednosti TMAX u prostorno-vremenskom domenu [°C]
| Variance_j | units |
|---|---|
| 24.239 | °C^2 |
Prikaz empirijskog prostorno-vremenskog variograma, fitovanog koriscenjem sum-metric modela. Model je dobijen koriscenjem funkcija vgmST() i fit.StVariogram(), R programskog paketa “gstat”. Priblizna vrednost koeficijenta anizotropije je sracunata empirijski koriscenjem funkcije estiStAni(). Za fitovanje modela variograma koriscena je sferna funkcija kod sve tri komponente: prostorne, vremenske i zajednicke - prostorno-vremenske.
Mean Squared Error (MSE) - srednja kvadratna greska optimizacije modela variograma po metodi najmanjih kvadrata
| Mean Squared Error | units |
|---|---|
| 1.0811 | °C |
| model | psill | range |
|---|---|---|
| Nug | 0.0000 | 0.00 |
| Exp | 4.3356 | 88495.95 |
| model | psill | range |
|---|---|---|
| Nug | 0.0000 | 0.0000 |
| Sph | 8.7455 | 11.4198 |
| model | psill | range |
|---|---|---|
| Nug | 0.0000 | 0 |
| Exp | 11.8805 | 1142842 |
| anisotropy | units |
|---|---|
| 478.6232 | km/day |
U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Koriscen je identican model - prostorno-vrmenski variogram dobijen na osnovu potpunog skupa merenja. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.
Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:
| RMSE | units |
|---|---|
| 1.386 | °C |
Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:
| R2 | units |
|---|---|
| 0.9815 | / |
Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima.
| MESEC | RMSE [°C] | MAX [°C] | MIN [°C] | MEAN [°C] | RANGE [°C] |
|---|---|---|---|---|---|
| Jan | 1.71 | 21.8 | -11.9 | 5.35 | 33.7 |
| Feb | 1.57 | 29.4 | -12.9 | 7.72 | 42.3 |
| Mar | 1.25 | 27.6 | -7.8 | 13.22 | 35.4 |
| Apr | 1.23 | 34.0 | 1.4 | 19.45 | 32.6 |
| Maj | 1.14 | 36.4 | 4.5 | 23.34 | 31.9 |
| Jun | 1.13 | 42.3 | 11.6 | 27.28 | 30.7 |
| Jul | 1.18 | 42.8 | 13.8 | 30.13 | 29.0 |
| Avg | 1.28 | 43.9 | 14.6 | 30.66 | 29.3 |
| Sep | 1.22 | 40.2 | 9.9 | 25.43 | 30.3 |
| Okt | 1.29 | 35.0 | 1.2 | 18.58 | 33.8 |
| Nov | 1.55 | 30.0 | -3.7 | 13.23 | 33.7 |
| Dec | 1.88 | 27.0 | -9.3 | 6.75 | 36.3 |
Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije po stanicama, na kojima je opazana temperatura - TMAX za dati vremenski period.
U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Minimalnih vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu globalnog (STRK_global) modela [Kilibarda et al., 2014], gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa.
U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.
Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:
| RMSE | units |
|---|---|
| 2.081 | °C |
Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:
| R2 | units |
|---|---|
| 0.9309 | / |
Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima. Ocigledno je da postoji zakonitost u podacima, kojom se opisuje manji opseg vrednosti, kao i greska predikcije u letnjim mesecima. U zimskim mesecima postoji veca varijabilnost seta podataka, kao i da je greska predikcije veca.
| MESEC | RMSE [°C] | MAX [°C] | MIN [°C] | MEAN [°C] | RANGE [°C] |
|---|---|---|---|---|---|
| Jan | 2.17 | 15.4 | -24.8 | -2.27 | 40.2 |
| Feb | 2.11 | 17.6 | -28.7 | -0.59 | 46.3 |
| Mar | 2.02 | 16.7 | -24.5 | 2.58 | 41.2 |
| Apr | 2.02 | 21.0 | -10.7 | 6.93 | 31.7 |
| Maj | 1.92 | 24.4 | -6.6 | 11.12 | 31.0 |
| Jun | 1.96 | 29.8 | -1.6 | 14.84 | 31.4 |
| Jul | 2.12 | 32.2 | 0.0 | 16.65 | 32.2 |
| Avg | 2.19 | 30.8 | 0.0 | 16.42 | 30.8 |
| Sep | 2.09 | 25.8 | -2.4 | 12.57 | 28.2 |
| Okt | 2.05 | 22.8 | -12.2 | 7.34 | 35.0 |
| Nov | 2.11 | 20.8 | -22.2 | 3.77 | 43.0 |
| Dec | 2.20 | 17.7 | -24.2 | -0.84 | 41.9 |
Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije metodom krosvalidacije po stanicama, na kojima je opazana temperatura - tmin za dati vremenski period.
U okviru ovog poglavlja dat je opis, metodologija i rezultati predikcije Minimalne vrednosti temperatura kao dnevnih karata na podrucju od interesa, obuhvacenog mernim stanicama. Metodologija se zasniva na koricenju predikcije primenom Regresionog Kriginga u prostorno-vremenskom domenu. Vrednost trenda je ocenjena na osnovu lokalnog (STRK_local) modela, gde su kao prediktori korisceni geometrijski temperaturni trend, DEM i TWI podaci na podrucju od interesa. Koeficijenti trenda, kao i vrednosti reziduala su ocenjeni na osnovu MLR - multiple linear regression modela, a zatiom je kreiran i variogram na osnovu ocenjenih reziduala. Izvrsena je ocena i fitovanje empirijskog prostorno-vremenskog variograma (sum-metric variogram, putem R paketa ‘gstat’).
Model koji je kreiran MLR regresijom, gde su kao prediktori korisceni GTT, DEM i TWI.
##
## Call:
## lm(formula = tmin ~ gtt_min + dem + twi, data = temp_df.lok)
##
## Coefficients:
## (Intercept) gtt_min dem twi
## 20.014113 0.861880 -0.009227 -0.723591
Nakon kreiranja prostorno-vremenskog variograma, koji opisuje set podataka i zavisnost - korelaciju izmedju merenja na razlicitim lokacijama i razlicitim vremenskim trenucima, potrebno je izvrsiti fitovanje modela - odredjivanje matematicke funcije i njenih parametara koji na najbolji moguci nacin opisuju set podataka. Fitovanje variograma se postize odredjivanjem inicijalnih parametara funkcije na osnovu vizuelnog pregleda podataka. Konacna empirijska funkcija, kao i njeni parametri se odredjuju automatski kroz vise iteracija. R programski paket “gstat” nudi vise modela za fitovanje variograma prostorno-vremenskih podataka: separable, product sum, metric, sum metric, and simple sum metric. Vise informacija o svakom modelu ponaosob se moze pronaci u radu [Graler et al., 2015]. Za modelovanje prostorno-vremenskog variograma vrednosti merenja Minimalne vrednosti temperatrura TMIN, koriscen je sum metric model, koji podrazumeva ukljucivanje prostorne i vremenske komponente putem modela kovarijansi - poluvariograma, kao i zajednicke komponente sa vrednovanjam parametra anizotropije. Prostorno vremenska funkcija kovarijanse data je na sledeci nacin:
\[ \begin{aligned} \mathbf{Csm (h, u) = Cs (h) + Ct (u) + Cjoint (sqrt(h^2 + (k*u)^2))} \end{aligned} \]
gde je:
U cilju odredjivanja inicijalnih vrednosti parametara variograma potrebno je zadati pocetne vrednosti parametra psill - parcijalni prag i range - domet. Vrednost parcijalnog praga je priblizno jednaka vrednosti varijanse seta podataka. Za pocetnu vrednost dometa moguce je uzeti 1/4 vrednosti dijagonale minimalnog obuhvatnog pravougaonika podrucja od interesa obuhvacenog stanicama, sa tim da se ta vrednost uzima samo za prostornu komponentu.
Srednja vrednost varijanse vrednosti TMIN na osnovu vrednosti po stanicama
| Variance_s | units |
|---|---|
| 13.6081 | °C^2 |
Srednja vrednost varijanse vrednosti TMIN na svim stanicama za posmatrani vremenski period [°C]
| Variance_t | units |
|---|---|
| 15.272 | °C^2 |
Srednja vrednost varijanse vrednosti TMIN u prostorno-vremenskom domenu [°C]
| Variance_j | units |
|---|---|
| 14.44 | °C^2 |
Prikaz empirijskog prostorno-vremenskog variograma, fitovanog koriscenjem sum-metric modela. Model je dobijen koriscenjem funkcija vgmST() i fit.StVariogram(), R programskog paketa “gstat”. Priblizna vrednost koeficijenta anizotropije je sracunata empirijski koriscenjem funkcije estiStAni(). Za fitovanje modela variograma koriscena je sferna funkcija kod sve tri komponente: prostorne, vremenske i zajednicke - prostorno-vremenske.
Mean Squared Error (MSE) - srednja kvadratna greska optimizacije modela variograma po metodi najmanjih kvadrata
| Mean Squared Error | units |
|---|---|
| 0.3267 | °C |
| model | psill | range |
|---|---|---|
| Nug | 0.2001 | 0.0 |
| Exp | 5.5829 | 439610.2 |
| model | psill | range |
|---|---|---|
| Nug | 0.0000 | 0.0000 |
| Sph | 3.3674 | 4.4342 |
| model | psill | range |
|---|---|---|
| Nug | 0.8277 | 0.0 |
| Exp | 9.0707 | 745700.6 |
| anisotropy | units |
|---|---|
| 195.1982 | km/day |
U ovom radu je koriscena metoda krosvalidacije - LOOCV u prostornom domenu sa pojedinacnim iskljucivanjem stanica iz predikcije. Koriscen je identican model - prostorno-vrmenski variogram dobijen na osnovu potpunog skupa merenja. Sa obzirom da su dostupno 65 mernih stanica sa opazanjima od 10 godina - ukupno 3652 dana, dobijeno je ukupno 233728 (64x3652) karata predikcije. Na osnovu dobijenih podataka sracunate su mere kvaliteta krosvalidacije: koeficijent determinacije i ukupna srednje kvadratna greska predikcije.
Srednja kvadratna greska - \(\mathbf{RMSE}\) (Root Mean Square Error) predikcije, dobijena krosvalidacijom nad setom podataka, metodom LOOCV:
| RMSE | units |
|---|---|
| 1.7833 | °C |
Koeficijent determinacije \(\mathbf{R^2}\) predikcije, dobijen krosvalidacijom nad setom podataka, metodom LOOCV:
| R2 | units |
|---|---|
| 0.9492 | / |
Analizom rezultata krosvalidacije u vremenskom domenu, nakon agregacije u prostornom domenu, moguce je ostvariti uvid u ocenu kvaliteta kao i opseg vrednosti po mesecima.
| MESEC | RMSE [°C] | MAX [°C] | MIN [°C] | MEAN [°C] | RANGE [°C] |
|---|---|---|---|---|---|
| Jan | 1.87 | 15.4 | -24.8 | -2.27 | 40.2 |
| Feb | 1.82 | 17.6 | -28.7 | -0.59 | 46.3 |
| Mar | 1.78 | 16.7 | -24.5 | 2.58 | 41.2 |
| Apr | 1.82 | 21.0 | -10.7 | 6.93 | 31.7 |
| Maj | 1.64 | 24.4 | -6.6 | 11.12 | 31.0 |
| Jun | 1.62 | 29.8 | -1.6 | 14.84 | 31.4 |
| Jul | 1.75 | 32.2 | 0.0 | 16.65 | 32.2 |
| Avg | 1.82 | 30.8 | 0.0 | 16.42 | 30.8 |
| Sep | 1.74 | 25.8 | -2.4 | 12.57 | 28.2 |
| Okt | 1.77 | 22.8 | -12.2 | 7.34 | 35.0 |
| Nov | 1.87 | 20.8 | -22.2 | 3.77 | 43.0 |
| Dec | 1.88 | 17.7 | -24.2 | -0.84 | 41.9 |
Agregacijom seta podataka u prostornom domenu, moguce je ostvariti uvid u gresku predikcije po stanicama, na kojima je opazana temperatura - TMIN za dati vremenski period.